值函数相关论文
深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习......
针对岛礁守备作战过程中涉及的对海、对陆、对空3类武器,根据岛礁守备作战过程建立模型,提出一种动态动作空间方法。设置敌方武器装......
深度强化学习作为机器学习的一个分支,其通过结合深度学习的感知能力与强化学习的决策能力实现了对从感知到行为端到端的学习。目......
过去的几十年里,最优分红问题一直是金融保险领域关注的热点问题。随着现代金融保险市场的快速发展,保险公司所涉及的策略由分红逐......
实际工程应用中,由于生产需要、工况变化或紧急的突发状况,系统包含着多种工作模式,既有随时间的状态连续演化,又有受离散时间驱动......
本文首先构造了带有广义方程约束的优化问题,对此问题的两种扰动形式进行了灵敏性分析,得到了扰动问题值函数的次微分关于满足Frit......
最优分红问题是金融保险中研究较多的问题之一,其中基于Cramer-Lundberg风险模型的研究也十分普遍.一般说来,要求得最优分红问题的......
强化学习的优化目标是寻找最优动作序列,解决复杂环境中的决策问题。结合了深度神经网络,深度Q学习(Deep Q-Network,DQN)是一种经典的......
利用次微分相关性质,并引入新的约束规范条件,对含参DC复合优化问题的值函数的Fréchet次微分进行了估计.......
与迪拉克操作符和部分衍生物联系了,这份报纸建立一些真实 Paley 牛肉熏香肠类型定理描绘其克利福德·福里尔变换(CFT ) 有紧缩......
该文共分八章,主要研究:1.复杂经济系统的基础性集成调控研究;2.经济增长点的建筑与调控理论;3.经济结构的转换与调控理论;4.上研......
该文对金融风险控制问题的理论与方法进行了研究,建立了金融风险问题中有关证券投资的若干数学模型,并在一定条件下,得到了证券投......
直复营销即一种可以得到客户直接回应的营销模式。作为企业的一项长期性经营活动,直复营销贯穿于企业发展的整个过程,因此,通常将......
学位
强化学习是机器学习研究中一个重要的方向,是智能体通过与环境交互来学习如何行为的方法。强化学习过程是一个以寻找最优策略为最......
本文主要在没有Isaacs条件下,研究带有不对称信息和相关信息的两人零和微分博弈以下两类问题:即上值函数的上共轭的等价形式,以及......
随着目标的多样化和实际环境的复杂化,现代雷达的探测能力正在面临十分严峻的挑战,而微弱目标的检测与跟踪问题就是其中之一。检测......
风险理论是金融数学和精算学中的重要组成部分,主要关注保险公司的商业运营,通过建立相关的风险模型,从而对保险公司经营中的风险......
本文运用随机控制理论研究连续时间复合二项模型带期望折现罚函数的最优分红问题。目的是得到使带期望折现罚函数的累积期望折现分......
小波去噪是一种经典而有效的图像去噪方法,但无论是硬阀值函数还是软阀值函数方法都有自身的缺点。为了克服小波阀值函数去噪中......
在变值逻辑体系下,对逻辑函数相空间进行可视化可间接显现逻辑函数的泛函数空间在进行置换与互补扩展后在相空间中的映射.本文建立......
本文考虑的是支付破产时刻赤字的复合泊松模型中的分红问题,正如Dickson,waters(2004)理解的一样,股东应该有义务去支付破产时刻的赤......
本文考虑有迁移项和竞争因素同时影响的一类非齐次非线性人口发展模型,利用Banach压缩映象原理得到了初边值问题经典解的整体在惟一......
在假设设证券价格服从维纳过程的基础上,运用随机最优控制理论,研究了带有交易费用的证券投资决策问题,首先给出值函数和效用函数的定......
基于非线性控制理论,研究股票价格具有有界L范数不确定性的期权定价问题在给出新的期权价格定义后,把期仅定价问题归结力求解微分对......
采用一非参数统计方法投影寻踪回归技术(Projection Pursuit Regression--PPR)建立牛网瓣口在体胃电(刺激)——舒缩应变(响应)关系,得到......
该文讨论一类单周期二模式预,决策模型(其特例是newsvendor问题)。在建立一般模型之后,作者就一些特例研究了值函数的一些性质,给出了求......
考虑一个具有常数红利边界的Sparre-Andersen风险模型,在此模型中提出一种新的再保险以保证在公司出现较小的赤字时再保险公司出资......
微分对策是对策论在动态情况下的发展,故又称为动态对策。它在军事对抗、航天工程、经济与金融、资源配置领域等具有非常广泛而重要......
本论文考虑一般的有穷维非线性控制系统的有限时区最优反馈控制的数值求解及收敛性问题。
寻找最优反馈是控制理论梦寐寻以求......
本文考虑具有Lipschitz非线性项的半线性热方程:的最优控制问题。我们将运用观测不等式,证明值函数(ψ)作为相应HamiltonJacobi方程......
本篇文章主要考虑的是如何最大化全部折现分红和最终的固定资产P的和。其中最终固定资产P表示保险公司在破产时所拥有的固定的可折......
随着保险市场的不断开放与发展,保险业的竞争越来越激烈,保险企业需要不断开发更具竞争性的产品,以及通过购买再保险等方法来增加......
在Pliska和Selby所建立模型的基础上,研究了具有固定交易费用的证券投资决策问题.通过进行函数变换,将证券投资决策的一类多维二阶偏微方程自由边......
我知道一些周期函数在定义域上存在最小正周期,如sinx,cosx,tanx,cotx等.但有些周期函数如常值函数、狄利克莱函数等均没有最小正......
在证券价格存在有界不确定性的假设下,研究了基于最差情况的最优证券投资决策问题.首先,建立了证券投资决策的微分对策模型,然后,证明了......
进一步完善高校贫困生助学体制,切实解决高校贫困生问题,是我国高等教育面临的一个十分紧迫而重要的理论课题和现实课题.仅着眼于......
考虑具有Lipschitz非线性项,半线性热方程的最优控制问题.我们将运用观测不等式,证明值函数ψ作为相应Hamilton-Jacobi方程的唯一......
运用随机最优控制理论,研究了风险敏感性随机最优控制问题.给出了值函数和风险规避系数的定义,并通过对值函数进行非线性变换,证明......
利用次微分相关性质,并引入新的约束规范条件,对含参DC复合优化问题的值函数的Fréchet次微分进行了估计.......
针对模型自由的随机线性离散时间系统,通过Q学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,......
一次绝对值函数是我们十分熟悉的一种简单函数,它与方程、分段函数等密切相关,自然成为知识的一个交汇点和高考命题的一个热点.但教材......
不同于以前的最优消费、投资问题研究,本文研究个人投资者的最优金融决策问题--如何决定最优的证券组合、消费和购买人寿保险,使其......